网络脆弱性管理是网络安全操作中心(CSOC)的关键功能,该中心有助于保护组织免受计算机和网络系统上的网络攻击。对手比CSOC拥有不对称的优势,因为这些系统中的缺陷次数与安全团队的扩展率相比,在资源受限的环境中减轻它们的速度相比,其速度明显更高。当前的方法是确定性和一次性决策方法,在优先考虑和选择缓解漏洞时,这些方法不考虑未来的不确定性。这些方法还受到资源的亚最佳分布的约束,没有灵活性来调整其对脆弱性到达波动的响应的灵活性。我们提出了一个新颖的框架,深深的瓦尔曼,由深入的强化学习代理和整数编程方法组成,以填补网络脆弱性管理过程中的这一空白。我们的顺序决策框架首先确定在给定系统状态下不确定性下为缓解的近乎最佳的资源,然后确定最佳的缓解优先级漏洞实例。我们提出的框架优于当前方法在一年内观察到的模拟和现实世界脆弱性数据优先选择重要的组织特定漏洞。
translated by 谷歌翻译